iT邦幫忙

2025 iThome 鐵人賽

DAY 22
0

一、研究背景
檢索增強生成(Retrieval-Augmented Generation, RAG)在近年成為大型語言模型(LLM)落地應用的核心框架。流程為:將外部知識資料庫向量化並建立索引,用戶查詢時查詢相關內容,再結合至模型上下文中生成答案。

優點: 降低了模型的記憶負擔,並提升知識即時性與準確度。
缺點:

  1. 相似度導向檢索:只依賴向量相似度,無法捕捉跨文件的隱含關聯。
  2. 缺乏多跳推理能力:無法有效處理連結的查詢。
  3. 可解釋性不足:結果只呈現文字段落,很難知道知識鏈路。

因此,microsoft 團隊提出GraphRAG 作為新興架構,以圖結構(Graph)補強 RAG 系統,提升檢索與推理的能力。

二、GraphRAG 架構

  1. 知識圖譜建構(圖譜表示)
  • 實體抽取(Entity Extraction):從文件中抽取人名、地點、技術……等節點。
  • 關係抽取(Relation Extraction):判斷節點間的語意關聯,例如:引用、因果、合作。
  1. 檢索策略(混合檢索)
  • 向量檢索:傳統 RAG 的語義相似度檢索。
  • 圖結構檢索:利用圖遍歷和多跳推理,找出跨文件的隱含關聯。
  1. 答案生成
    將檢索得到的文本片段與圖結構輸入 LLM,透過 Prompt 工程或結構化輸入JSON,最終生成結果

三、GraphRAG挑戰

  1. 建圖成本高:需大量運算和人工校對與修正。
  2. 維持複雜度:知識隨時間演化,圖結構需持續更新。
  3. 系統整合難度:如何有效融合 VectorDB 與 GraphDB,是工程落地的瓶頸。

四、簡單的例子

假設我們要查:「手機快充技術是怎麼發展的?」

  • 傳統 RAG:找到一篇文章,告訴你 A 公司做了快充。
  • GraphRAG:
    A 公司 → 快充晶片 → B 公司專利 → 充電標準 → C 公司合作
    最後說明:這技術是多家公司合作、標準化之後才成熟。

五、代表公司

  • 向量資料庫:Milvus、Weaviate
  • 圖資料庫:Neo4j

上一篇
Day21 MoE(Mixture of Experts)
下一篇
Day23 多模態檢索(Multimodal RAG)
系列文
AI初學者入門30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言